AR, MA y ARMA: Teoría y Práctica
2026-02-01
Un proceso estocástico \(\{Y_t\}\) es una colección de variables aleatorias indexadas en el tiempo. \[ {y_1, y_2, \dots, y_T} \]
Considere por ejemplo una colección \(T\) de valores \(\varepsilon_t\) aleatorios e independientes identicamente distribuidas
\[ {varepsilon_1, varepsilon_3, \dots, varepsilon_T} \\ \varepsilon_t \sim N(0, \sigma^2) \]
Características:
Tipos:
Un proceso \(\{Y_t\}\) es débilmente estacionario si:
. . .
\[\rho_k = \frac{\gamma_k}{\gamma_0} = \frac{Cov(Y_t, Y_{t-k})}{Var(Y_t)}\]
Propiedades:
Utilidad:
La PACF mide la correlación entre \(Y_t\) y \(Y_{t-k}\) eliminando el efecto de los rezagos intermedios.
\[\phi_{kk} = Corr(Y_t, Y_{t-k} | Y_{t-1}, ..., Y_{t-k+1})\]
Clave para identificación:
\[Y_t = c + \phi_1 Y_{t-1} + \phi_2 Y_{t-2} + ... + \phi_p Y_{t-p} + \varepsilon_t\]
donde:
. . .
Interpretación: El valor actual depende linealmente de sus \(p\) valores pasados más un shock aleatorio.
Definimos el operador de rezago \(B\): \(B Y_t = Y_{t-1}\)
El modelo AR(p) se puede escribir como:
\[\phi(B) Y_t = c + \varepsilon_t\]
donde \(\phi(B) = 1 - \phi_1 B - \phi_2 B^2 - ... - \phi_p B^p\)
Polinomio característico: \(\phi(z) = 1 - \phi_1 z - \phi_2 z^2 - ... - \phi_p z^p\)
Un proceso AR(p) es estacionario si y solo si:
Todas las raíces del polinomio característico \(\phi(z) = 0\) están fuera del círculo unitario.
Equivalentemente: \(|\phi_i| < 1\) para todas las raíces.
Ejemplo AR(1): \(Y_t = \phi Y_{t-1} + \varepsilon_t\)
\[Y_t = \phi Y_{t-1} + \varepsilon_t, \quad |\phi| < 1\]
Propiedades:
Identificación:
\[Y_t = \phi_1 Y_{t-1} + \phi_2 Y_{t-2} + \varepsilon_t\]
Condiciones de estacionariedad:
Comportamiento de la ACF:
| Característica | AR(p) |
|---|---|
| ACF | Decae gradualmente (exponencial o sinusoidal) |
| PACF | Corte abrupto después del rezago p |
| Orden | p = último rezago significativo en PACF |
Regla práctica: Si PACF tiene corte claro en rezago p y ACF decae → AR(p)
\[Y_t = \mu + \varepsilon_t + \theta_1 \varepsilon_{t-1} + \theta_2 \varepsilon_{t-2} + ... + \theta_q \varepsilon_{t-q}\]
donde:
. . .
Interpretación: El valor actual es una combinación lineal de shocks aleatorios actuales y pasados.
Usando el operador de rezago:
\[Y_t = \mu + \theta(B) \varepsilon_t\]
donde \(\theta(B) = 1 + \theta_1 B + \theta_2 B^2 + ... + \theta_q B^q\)
Importante: Los modelos MA son siempre estacionarios (son combinaciones lineales finitas de ruido blanco).
Un proceso MA(q) es invertible si y solo si:
Todas las raíces del polinomio \(\theta(z) = 0\) están fuera del círculo unitario.
¿Por qué importa?
\[Y_t = \varepsilon_t + \theta \varepsilon_{t-1}, \quad |\theta| < 1\]
Propiedades:
Identificación:
Autocorrelación:
\[\rho_k = \begin{cases} \frac{\sum_{j=0}^{q-k} \theta_j \theta_{j+k}}{\sum_{j=0}^{q} \theta_j^2} & k = 1, 2, ..., q \\ 0 & k > q \end{cases}\]
donde \(\theta_0 = 1\).
Característica clave: ACF se anula después del rezago q (memoria finita).
| Característica | MA(q) |
|---|---|
| ACF | Corte abrupto después del rezago q |
| PACF | Decae gradualmente (exponencial o sinusoidal) |
| Orden | q = último rezago significativo en ACF |
Regla práctica: Si ACF tiene corte claro en rezago q y PACF decae → MA(q)
\[Y_t = c + \phi_1 Y_{t-1} + ... + \phi_p Y_{t-p} + \varepsilon_t + \theta_1 \varepsilon_{t-1} + ... + \theta_q \varepsilon_{t-q}\]
. . .
Forma compacta:
\[\phi(B) Y_t = c + \theta(B) \varepsilon_t\]
donde:
Para que un proceso ARMA(p,q) sea válido:
Estacionariedad: Raíces de \(\phi(z) = 0\) fuera del círculo unitario
Invertibilidad: Raíces de \(\theta(z) = 0\) fuera del círculo unitario
Parsimonia: No debe haber factores comunes entre \(\phi(B)\) y \(\theta(B)\)
| Modelo | ACF | PACF |
|---|---|---|
| AR(p) | Decae gradualmente | Corte en rezago p |
| MA(q) | Corte en rezago q | Decae gradualmente |
| ARMA(p,q) | Decae gradualmente | Decae gradualmente |
Desafío: Cuando ambas decaen, determinar p y q es más complejo.
Soluciones:
AIC (Akaike Information Criterion):
\[AIC = -2\log(L) + 2k\]
BIC (Bayesian Information Criterion):
\[BIC = -2\log(L) + k\log(n)\]
donde:
Regla: Seleccionar el modelo con menor AIC/BIC (equilibrio ajuste-parsimonia).
UTB-ETD | Programa de Ciencia de Datos